在前一篇文章中,我們探討了 Zero-1-to-3 系列模型的應用,其效果非常驚人。不過,如果僅用一張圖片來重建完整的 3D 模型,讓系統自行「腦補」看不到的部分,對模型來說是個挑戰。通常我們會從多個角度拍攝物件的照片,以提供模型重建時更完整的參考依據。
過去幾年來,多角度的 3D 建模技術吸引了許多研究者的關注,其中 NeRF(神經輻射場)技術更成為了一個標誌性解決方案。然而,2023 年 3D Gaussian Splatting(簡稱 3DGS)技術的誕生,因其高效且簡便,逐漸成為新的焦點。
3DGS,全名為 3D Gaussian Splatting(中文有人翻作「3D 高斯潑濺」),雖然是 2023 年才發表的新技術,但它的表現已經在計算機視覺領域引起廣泛關注。相比 NeRF,3DGS 的速度更快,訓練效率也高得多,能夠快速重建 3D 場景,並且生成的效果不輸 NeRF。使用者只需提供多角度的 2D 照片或影片,3DGS 就能自動學習並重建出高品質的 3D 模型。
在 3D 建模領域,NeRF (Neural Radiance Fields) 曾一度是備受矚目的技術,但 3DGS 的出現,為這個領域帶來了新的突破。以下表格比較了 3DGS 和 NeRF 的一些關鍵差異:
特性 | 3DGS | NeRF |
---|---|---|
速度 | 更快 | 較慢 |
訓練效率 | 訓練時間較短 | 訓練時間較長 |
渲染方式 | 基於 Splatting 技術,直接將高斯橢球渲染到圖像平面上 | 基於體素渲染,需要密集採樣場景中的點,計算量較大 |
應用 | 適合需要快速重建和渲染的場景,例如遊戲、VR/AR | 適合追求極致細節和真實感的場景,例如電影特效 |
總體來說,3DGS 在速度和效能上優於 NeRF,更適合應用於實時性要求高或算力受限的場景。
如果想深入了解 3DGS,可以參考以下資源:
3DGS 的核心在於將場景表示為大量帶有空間資訊的「高斯橢球」,這些橢球包含位置信息、形狀、顏色和透明度,並在渲染過程中利用這些橢球來生成 3D 圖像。
簡單來說,3DGS 通過優化高斯橢球的參數,使生成的圖像與輸入的照片更接近,從而構建出逼真的 3D 場景。
3D Gaussian Splatting 是一個充滿潛力的新技術,相較於過去的 NeRF,展現了更高效的建模和渲染速度。隨著技術的發展,我們將看到它在更多應用中的實現,尤其是需要高效率和即時性建模的場景。明天我們將介紹幾款 Android 上的 3D 掃描 APP,這些應用程式部分已經集成了 3DGS 技術,是你進行 3D 掃描建模的絕佳工具。